谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。
来自主题: AI技术研报
8713 点击 2024-03-05 10:35
谷歌在语言和声控计算机界面的漫长道路上又迈出了重要一步。最新ScreenAI视觉语言模型,能够完成各种屏幕QA问答、总结摘要等任务。
刚刚,谷歌DeepMind首席科学家Jeff Dean,首席执行官Demis Hassabis两大佬联手发布了2023人工智能领域超权威的谷歌年度研究总结。